1
Oltre il 1D: Perché l'awareness della disposizione 2D è fondamentale
AI023Lesson 7
00:00

Mentre i kernel 1D trattano i dati come un flusso lineare, Consapevolezza della disposizione 2D sposta il paradigma verso il trattamento di strutture "matrici". L'hardware moderno delle GPU ottimizza le prestazioni raggruppando gli elementi in griglie 2D per massimizzare la località spaziale e sfruttare i core specializzati per tensori.

1. Oltre l'elementwise

In 1D, ogni thread calcola uno scalare. Nei kernel 2D di Triton, il programma opera su blocchi interi contemporaneamente. Questo generalizza l'addizione vettoriale semplice in trasformazioni matriciali complesse come GEMM.

2. Località spaziale

Comprendere come gli elementi adiacenti (orizzontali e verticali) vengono caricati nella cache rappresenta il salto tra kernel educativi e quelli pronti per la produzione. Ciò garantisce che, anche con memoria trasposta o riempita, il kernel acceda ai dati senza spreco di larghezza di banda.

Flusso lineare 1DGriglia 2D a matrici (consapevole della disposizione)Generalizzazione della matrice

3. Il percorso verso la produzione

Padroneggiare le disposizioni 2D consente di suddividere i dati tra Streaming Multiprocessors (SMs) in modo efficiente. Ad esempio, una copia di matrice che riconosce larghezza/altezza può caricare matrici 16×16 nella memoria veloce sul chip, rispettando lo "stride" fisico del tensore.

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>